Yiksan0315's Blog

Decision Tree Regression

# Tag:

  • Source/KU_ML

Decision Tree Regression

Decision Tree를 이용한 Regression.

Decision Tree에서 데이터를 split하는 기준이 Information Gain이었다면, Regerssion에서는 MSE for node를 이용한다.

  • : 평균 label 값.

이 때, MSE가 일종의 Variance로 볼 수 있는데 Split된 값들 끼리 label이 비슷하기를 원하므로 Variance가 작은 것을 선호한다.

split 후의 Average MSE는

즉, Split을 한 후의 Variance 차이가 큰 것을 이용한다.

Tree Learning Algorithm for Regression

  • Decrease in MSE, Tree Learning Algorithm에서 Decision Tree와 동일하게 하되, Information Gain이 큰 것 대신 Decrease in MSE가 큰 것을 고른다.
  • 또한, 반환값 역시 class 대신 평균 label 값인 을 반환한다.
    • 혹은, : 방식의 Linear Regression fit 방식을 이용할 수도 있다. Node에 속한 를 가지고 Regression한다.
  • MSE()가 Threshold보다 작으면 Leaf Node로 만든다.
    • Threshold가 작아질수록 Tree가 커지니 적절한 Threshold를 찾아야 한다.

평균 label 값 으로, Linear Regression을 이용해 노드에 속한 를 가지고 regression을 해 값을 추정할 수도 있다.

toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.